Вычислительная техника пережила фундаментальный сдвиг от оптимизированной по времени задержки проектирования процессора к ориентированной на пропускную способность архитектуре графических процессоров. В то время как процессор подобен скоростному мотоциклу доставки (быстрый для одного пакета), графический процессор — это огромный грузовой корабль: он движется медленнее на один элемент, но одновременно перевозит 50 000 контейнеров.
1. Задержка против пропускной способности
Процессоры разрабатываются с целью минимизации «времени выполнения» для одной последовательности инструкций с помощью сложной предсказания ветвления. Напротив, графические процессоры (GPU) разработаны для максимизации «работы в секунду», выполняя тысячи потоков параллельно, жертвуя скоростью одного потока ради огромной общей пропускной способности.
2. Распределение транзисторов
Графический процессор обеспечивает гораздо более высокую пропускную способность команд и полосу пропускания памяти, чем центральный процессор при аналогичном ценовом и энергетическом уровне. ГПУ специализируются на высокоуровневых параллельных вычислениях и используют больше транзисторов на блоки обработки данных (АЛЮ), в то время как ЦПУ уделяют больше транзисторов кэшированию данных и управлению потоками.
3. Эволюция CUDA
Архитектура унифицированного вычислительного устройства (CUDA) была представлена компанией NVIDIA в 2006 году. Это платформа и модель параллельных вычислений, которая позволяет значительно повысить производительность за счёт использования мощности графического процессора независимо от графических интерфейсов приложений.